AI生成与版权保护
朱开鑫 腾讯研究院
近期,国内外AI版权领域的司法实践发展迅速。8月18日,美国哥伦比亚特区法院就“泰勒诉美国版权局AI绘画版权登记案”做出判决;8月24日,北京互联网法院在线公开审理了首例“AI文生图著作权案”。聚焦上述案件,不难发现“何种程度的人类创作干预,可以让AI生成内容获得版权保护”,已然成为当下AI版权领域的核心问题。本文尝试从新技术对版权制度的影响着眼,聚焦“AI生成内容可版权性”这一议题,抛出些许思考,供未来探讨。
美国“泰勒诉版权局案”:
完全由AI生成的
内容不享有版权。
原告泰勒(Stephen Thaler)研发了AI软件“Creativity Machine”,并用其自动生成了一幅绘画“A Recent Entrance to Paradise”。在美国版权局以“该作品没有人类参与创作”为由拒绝其版权申请后,原告向哥伦比亚特区法院起诉,要求更正版权局的决定。[1]值得注意,一方面本案作为行政诉讼,有案件审理的特殊性。根据美国《行政诉讼法》规定,“就‘特定行政决定’是否合法的判断,法院依据的信息既不能多于也不能少于行政机关做出决定时所掌握的信息”。另一方面本案适用简易审理程序,表明原、被告对于案件事实本身不存在争议,法院仅需要解决涉及的法律问题。
因此,当原告在诉讼中试图新增证据,表明自身在涉案AI绘画生成过程中存在创作贡献和干预时[2],主审法官Howell予以拒绝并表示,这与法庭查明的涉案作品的前期注册事实不符。在向美国版权局提交的注册申请中,原告三次强调并确认涉案绘画内容由“AI自主生成”且“缺乏人类作者干预”。[3]作为行政诉讼案件,原告不能超出美国版权局做出裁定时依据的事实来重新主张自身权益。
Howell法官指出,本案唯一需要解决的法律争议是“完全由AI生成的内容能否获得版权”,因此无需对原告新增证据涉及的“何种程度的人类干预,才能让AI生成内容获得版权”这一更具挑战性的法律问题加以回应。最终基于“版权法仅对自然人进行财产权激励”“版权法渊源表明作者身份等同于人类创作”“联邦最高法院一直坚持人类作者的要求”三点理由,重申了美国版权法“只保护人类作者身份,不对纯机器生成内容加以保护”的论断,驳回了原告的起诉。
国内“AI文生图案”:
需证明人类对
AI生成内容的创作贡献。
原告李某利用开源AI软件Stable Diffusion生成了一幅绘画,并发布在自己的“小红书”主页中。被告刘某是一名创作爱好者,在“百家号”发布的诗歌中将涉案AI图像用作插图。原告就此向北京互联网法院提起诉讼,主张涉案AI图像构成美术作品[4],被告上述行为构成信息网络传播侵权等。本案未当庭宣判。从庭审现场来看,法庭高度关注“AI图像是否存在人类的创作贡献,进而获得版权法保护”。
法庭要求原告当庭展示涉案AI图像的生成过程,并就独创性有无加以说明。在生成涉案AI图像过程中,原告:首先,需要从开源Stable Diffusion软件内置的多个图像模型中选择一个最符合目标图像风格的模型;其次,编辑、输入对目标图像加以描述限定的、较为复杂的“正向提示词”和“反向提示词”;再次,对众多不同的模型参数加以分别设置,最终才能生成理想的目标图像。关于自身对AI图像的创作贡献,原告整体强调:
第一,AI模型仅是工具,不能自主生成任何内容。原告在涉案AI图像生成过程中对于模型类型、正反提示词、绘画参数等的选择设置体现出了个性化创作贡献;第二,涉案AI图像达到了美术作品应有的创作高度,一般公众均会认可其艺术价值;第三,不能因为AI绘图模型相较于此前其他创作工具更先进,便否认自然人在创作过程的主导作用,全自动照相机拍出的照片都可以构成摄影作品,而原告的上述创作贡献明显高于按动相机快门和选择拍摄时间这类操作。
“技术之子”的新挑战:
被迫驶入相对陌生
的创作领域。
虽然版权一直被誉为“技术之子”,但回溯版权发展史,其更适合被称为传播技术之子。整体来看,版权制度的发展贯穿两条主线:一是,新技术带来新的传播方式,进而丰富版权权利类型;二是,新技术带来新的传播载体,进而拓展版权客体种类。版权“copyright”一词的由来,便是印刷、造纸技术发展催生出以“复制copy”为核心的权利体系,之后伴随无线电、互联网、移动互联网等传播技术的更迭,推动广播、信息网络传播、网络直播等新权利,以及录音录像、数字音乐、视听动画等新客体的诞生。
直到生成式AI崛起之前,相较于传播技术而言,创作技术对于版权制度的影响可谓是甚微。这其实也容易理解,创作在整个版权制度中是一个前置环节,版权专有权利体系的核心定位本就是解决,作品创作以后的传播利用问题。创作领域,人们能直观感受到的或许只有拍摄技术的进步催生出摄影、电影等作品。至于游戏视听领域的数字创作技术,只是延伸性的辅助技术手段而已,需要高度依赖人的创作构思。长久以来,创作一直被视为人类专属的垄断领域,这其中最为核心的“创作表达空间和独创性选择安排”只能由人类来完成实现,别无替代。
随着生成式AI被纳入人类的创作工具箱,版权制度不得不面对相对陌生的创作领域技术的挑战。这正是前述“美国版权局被诉案”中,Howell法官的感叹。生成式AI的出现使得在作品最终形成过程中,人类的贡献不断衰减而机器的贡献不断提升,这直接冲击了人类的创作主体定位,并引发了一系列新的思考。诸如,怎样评估AI生成内容的独创性问题?何种程度的人类干预才能保障生成内容获得版权?以及如何利用版权制度来激励涉及AI工具的作品创作等。
从“算法推荐”到
“AI生成”:对版权主体
的探讨未曾停止。
就新技术对版权制度的影响而言,在本轮生成式AI之前,国内版权理论和实务界更多聚焦于对算法推荐的探讨。“算法推荐”和“AI生成”两个议题,本质上具有高度的相似性,都是关注机器在版权领域对于人类行为的“替代”。“算法推荐”作为传播领域的一项新技术,其并未带来新的版权权利类型,而是赋能作品各类传播权利更加精准和高效的行使。虽然在直观感觉上,算法推荐一定程度上代替人类决定对哪些内容进行推送,但本质上仅是自动化程度更高的人类传播工具而已。真正的内容传播主体,依旧是算法推荐背后的使用者而非机器算法本身,否则便无法解决后续侵权责任承担等系列问题。
2021年12月31日,海淀法院在判决的国内算法推荐第一案——“延禧攻略案”中,便指出信息流推荐技术(也即算法推荐),仅仅起到了向用户精准、高效推荐的作用,其本质上是被告向用户提供网络服务的辅助工具,具有实质性非侵权用途,本身并不是本院判断是否构成帮助侵权的对象。本案的评判对象,是作为这一技术应用者或工具使用者的被告,在采用信息流推荐技术为用户提供服务的过程中,是否对涉案侵权后果的产生具有过错,应否承担相应的法律责任。[5]
同理,“AI生成”聚焦内容创作领域,也没有带来新的作品客体类型,只是让传统的文字、美术、音乐等作品的创作过程自动化水平大为提升,但归根结底还是使用AI模型的人在创作。否则,对于AI生成内容后续的授权利用、维权索赔以及责任承担等问题都难以解决。至于说,借由“法人(雇佣)作品”制度来解决AI主体问题更是难以成立:一方面,人无法雇佣机器来帮自己进行创作,否则这将陷入默认“机器是创作主体”的逻辑反复诡辩;另一方面,如果按照“法人作品”的逻辑,更是会得出“AI作品是由机器主持、代表机器意志、由机器承担责任”的滑稽谬谈。
版权对于自然人主体的坚守,不论是此前算法推荐涉及的传播主体,还是当下AI生成涉及的创作主体,都不会简单的在版权法体系内被颠覆改变。原因在于版权仅仅是民事权利的一种,除非在整个民法体系对主体制度进行变革,否则过多的探讨并无实质意义。就当下AI的发展阶段而言,虽然人们已经开始广泛探讨大语言模型对图灵测试(Turing Test)的突破和令人兴奋的涌现能力(Emergent Ability)[6],但我们不得不承认目前还远未达到突破“人-物和主体-客体”二分理论的技术临界点。
AIGC可版权性的核心判断:
“映射呈现”还是“实质取代”?
AI生成内容版权属性的核心判断在于:AI究竟是仅作为一种辅助工具,对人类的创作构思加以“映射呈现”,还是说“实质取代”了人类对作品创作元素(文学、艺术、科学领域的选择、表达、编排等)的构思设计?这需要对AI模型的运作机制以及人类利用AI工具进行创作的具体方式加以评估。在生成式AI出现之前,对于机器生成内容的可版权性探讨,最具挑战性的问题莫过于摄影作品的属性认定。这一领域的代表性案例当属1884年美国联邦最高法院判决的“Burrow-Giles诉Sarony”案。[7]
在该案中,联邦最高法院指出虽然照片是由摄像机这一机器设备而非人类直接生成的,但仍然代表了摄影师的创作构思,所以构成受版权法保护的作品。实际上,摄像机仅是对陈设在其面前的场景进行了“映射呈现”,这只有在摄影师对预期的目标照片进行内心构思之后才可能实现。内心构思涉及到的创作元素的最终选择安排,都是由摄影师决定的。例如,在摄像机前指导人物摆好姿势,选择搭配的服装、帷幔以及其他各种装饰,设计光线和阴影,布置希望的场景,并构思如何根据这些选择、设计、布置等实现整体的拍摄效果。
通俗来讲,版权法保护的是人类的创作构思,即“对于创作元素最终和具体的选择安排”。特定AI生成内容能否构成作品,要具体分析AI使用者和AI模型在创作过程中的贡献。如果对于作品的创作空间、独创性的选择安排都是由使用者主导控制,没有给机器预留出发挥的空间,那么AI生成的内容基于人类的创作贡献构成作品,当属无疑;如果对于AI生成的内容,创作空间均由AI大模型自动填补,那么由于缺乏人类的创作性贡献,则很难被认定为作品受到保护。
但就AIGC现有的内容生成模式而言——使用者通过设计“提示词和模型参数”来生成内容,其实很难就使用者和AI模型的创作贡献大小加以准确判断。这里想论述的是,无需强求使用者在AI生成内容过程中存在过高的创作干预程度,达到对AI生成内容的“控制与预见”标准即可。因为对于我国《著作权法》中作品独创性的判断,更合理的标准是“定性”层面的“独创性有无”而非“定量”层面的“独创性高低”。近年来,司法实践中秉持的也多是“一点火花原则”。过度纠结使用者对AI生成内容独创性贡献的高低,没有现实意义也难以精准把握,只要能证明自然人存在创作贡献且与生成内容存在必要联系即可。
AIGC可版权性的
实操标准:能够体现
人类的“创作构思”。
无论版权制度如何顺应技术的变迁,对于人类主体身份的坚持都不会改变,即使人类是通过新工具进行创作或新载体加以传播。2023年9月8日,79位艺术家在著名的知识共享组织Creative Commons上发布了一封公开信表示,Stable Diffusiopn、GPT等AIGC模型只是一种艺术创作辅助工具,真正为艺术作品注入灵魂的始终是自然人。艺术家们表示,生成式AI将推动创作平权时代的加速到来,普通大众被艺术创作拒之于门外的境遇,未来也将显著改变。[8]
对于何种程度的人类干预,足以使AI生成内容获得版权,需要具体分析。在2023年7月12日美国国会召开的第二场“人工智能与版权法”听证会中,埃默里大学法学院人工智能、机器学习和数据科学Matthew Sag教授提出:为何简单的文字提示不足以让AI使用者成为作者?因为这种情况更像是给助理下达指令,让他创作一部作品。使用者不知道Midjourney等AI模型会将哪些元素整合在一起创建图像,也不知道将如何把这些潜在元素组合在一起。[9]
但如果使用者能够使AI模型输出的内容反映自身的“创作构思”,那么可版权性的条件便能够达成。一方面,可以通过足够详细的文本提示,对预期生成的目标内容细节加以具体限定,来满足版权法保护要求。另一方面,对于文本提示的不断完善调整和在不同输出结果内容间进行选择,也是一种让使用者获得作者身份的AI使用方式。因为许多情况下作者身份的认定,都涉及生成替代方案并在其中加以选择。以摄影作品为例,作者对拍摄时间和构图的选择和控制,便是认定照片可版权性的关键。
前述国内“AI文生图著作权案”中,原告对于“自身创作贡献”及“未给机器留出可发挥创作空间”的释明,可以为理解上述问题提供一定参考。原告现场展示:第一,要想获得理想的AI图像,使用者需要经过一系列复杂的“正、反向提示词”设计和“模型参数”设置;第二,使用相同的经过设计的正、反向提示词和模型参数,可以生成相同的AI图像;三,改变正反向提示词和模型参数中的任一内容,均会导致AI生成图像的显著变化。
AIGC可版权性的
实现路径:避免过于
激进的制度创新。
从版权的制度目的和产业实践来看,对AI生成内容加以保护具有现实必要性。一方面,给予AI生成内容版权保护,能够实现版权法“激励作品创作”的内在目标。但激励和保护的主体是利用AI生成作品的人而非AI本身,因为在当下阶段,大模型生成内容仍需经由使用者输入prompts来触发。需要注意的是,对于AI生成内容的版权保护,绝不等于对AI版权法上主体地位的认可。
另一方面,不对AI生成内容加以保护会带来负面影响。首先,缺乏版权保护会影响AI模型使用方的内在动力,“有恒产者才有恒心”。进一步,有可能经由下游AI大模型采买、使用的减少,反向影响上游AI大模型的研发、训练。其次,缺乏版权保护,会影响甚至破坏AI生成内容后续IP授权和维权的权利稳定性,不利于全社会文化的传播、内容的丰富;再次,缺乏版权保护,会导致对AI内容不经授权的任意利用,这将引发创作、交易市场秩序的混乱,并产生额外的治理成本。至于“反法”等其他保护模式,则仅能通过规制侵权行为,解决被动的维权问题,但无法解决作品内容的主动授权传播问题。
但是,对于AI生成内容的版权保护,不宜在版权制度层面采取过于激进的变革举措,例如新增客体类型这类思路。一方面,AI生成内容不管是作为新的作品类型或者是邻接权客体类型,都无法避免与既有作品类型外观重合的问题。AI生成内容和非AI生成内容,本质上只是创作工具的不同,生成内容的外在表现形式并无本质差异,最终还是会落入到既有版权客体类型范畴之内。
另一方面,即使借鉴英国的“计算机生成作品”模式,对AI生成内容设置权利范畴(缺乏人身权保护)和保护期限(相较一般作品70年,其仅保护50年)的特殊限制,也存在实践中难以落地风险。自英国在《1988年版权、外观设计和专利法》中创立“计算机生成作品”(Computer-generated Work)以来,这一规定几乎成为了“僵尸条款”。仅英国衡平法院在2006年1月20日做出一例判决——“Nova Production v Mazooma Games”案,即将街头游戏机呈现的画面认定为“计算机生成作品”。但时至今日,该判决的现实价值愈发淡化,因为将游戏画面纳入“视听作品”保护几乎已成为各国共识。
导致“计算机生成作品”在英国难以落地的内在原因,很可能是制度本身产生的负面激励问题。为了防止自身作品被认定为“计算机生成作品”,受到版权法权利范围和保护期限的“歧视”,创作者大概率会隐瞒这一事实,这在当下AIGC领域同样也可能发生。此外,如何对AI生成内容和非AI生成内容加以区分,也是一个现实难题,除非经过专业技术手段的鉴别(但目前来看,鉴别准确率也难以保证),二者在形式外观上没有本质差异。
写在最后:关于AI生成
内容版权保护
的三点思考。
思考一:只要AI生成内容满足客观上的独创性要求,便可以落入版权法作品保护范畴。当然,需要AI模型使用者能够证明自身的创作贡献以及与生成作品间的必要联系。但这更多是在发生相关作品权属、侵权等争议之后。从版权法角度来看,虽然不强调AI生成创作的“独创性高低”,当仍需满足“独创性有无”。
思考二:认定AI生成内容具体构成何类作品,需要看AI生成内容的外观表现形式,符合版权法对于哪些特定作品的要求。根本来看,AI生成内容不会构成一类全新的版权客体类型,最终还是会落入文字、美术、音乐、视听等既有作品范畴之中。
思考三:无需过度纠结AI生成内容质量的高低,即使有些提示词和模型参数可能设计的较为简单,生成内容的独创性没那么高,但非AI生成内容的独创性也会存在高低差异。低质量的AI生成作品,也包括相对简单的提示词可能产生的同质化作品[10],最终都会被市场所筛除和抛弃,相应的权利人也不会有过高的传播和商业利用预期。归根结底,法律只需解决特定内容是否受到版权保护的问题,诸如艺术价值、市场价值此类问题则应当交由市场来加以评判。
[2]Thaler新增主张的核心可概括为:作为AI绘画生成工具的Creativity Machine完全由其控制;只能在其指示下运行;自身向Creativity Machine发出了内容生成指令。[3]原告此前在作品登记过程中,三次均表示涉案绘画是 “由运行在机器上的计算机算法自动创建的”:2018年11月3日,向版权局提交作品登记时;2019年9月23日,在版权局拒绝进行作品登记后,第一次提起复议时;2020年5月27日,再一次被版权局驳回后,第二次提起复议时。[4]为了防止AI生成方式对作品类型认定产生影响,原告还兜底性地主张,涉案AI图像至少落入《著作权法》“其他类型作品”的保护范围。[5]参见北京市海淀区人民法院民事判决书,(2018)京0108民初4942号。[6]所谓涌现能力,就是当人工智能模型参数达到一定量级之后,会突然拥有包括常识推理、问答、翻译、摘要等一系列类似人类的“智慧能力”。自从2020年Open AI研发了1750亿参数规模的GPT-3之后,生成式人工智能的涌现能力便引发关注,可以通过“prompts”问答的方式,出色完成内容生成、人机对话、文本图像改写等各种任务。[7]See Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53, 58 (1884).[8]See Open Letter: Artists Using Generative AI Dend Seat at Table from US Congress, https://creativecommons.org/about/program-areas/policy-advocacy-copyright-reform/open-letter-artists-using-generative-ai-demand-seat-at-table-from-us-congress/。[9]See Artificial Intelligence and Intellectual Property – Part II: Copyright,https://www.judiciary.senate.gov/artificial-intelligence-and-intellectual-property_part-ii-copyright。[10]简单来说,构成版权侵权需要满足“接触+实质性相似”的标准,仅“实质性相似”但都是独立完成(没有接触在先作品)的作品,也不构成侵权,仅仅是创作巧合。一些简单的提示词或者偶然的情况下,不同用户使用AI工具也存在生成类似内容的可能,但相互之间也不会构成侵权。举个现实的例子,不同游客可能都会从同一角度对某个名胜古迹进行拍照,进而得出高度相似的摄影作品。但在先的拍摄者一般不能也不会主张在后的摄影作品构成侵权,同时在先拍摄者对于其摄影作品的市场价值和传播价值也不会存在较高的预期。
推荐阅读
朱开鑫、张艺群:《“你的AI侵犯了我的版权”:浅谈AIGC背后的版权保护问题》